之前在做app時我們發生了一些問題,在爬蟲時,有時會非常不順利,爬到一半之後出錯,後來查資料後發現,那是因為他們可能會覺得我們是惡意再爬去資料,所以阻擋我們,我們可以將設計的爬蟲程式偽裝成瀏覽器,這方法就是在程式前加上header內容
import requests
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64)\ AppleWebKit/537.36(KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36', }
url = 'https://www.net-fashion.net/'
htmlfile = requests.get(url, headers = headers)
htmlfile.raise_for_status()
print("success")
可以看到跑出來success代表我偽裝瀏覽器成功,這樣在爬資料時,網頁就不會認為你在惡意攻擊